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摘要 : 区 划 问 题 是 将 特定 地 理 区 域 划 分 为 耕 干 空间 连续 的 分 区 ， 满 足 分 区 内 差异 最 
小 和 分 区 间 差 异 最 大 这 一 基本 原则 ， 广 泛 应 用 于 地 理 、 环 境 、 生 态 、 经 济 、 农 业 、 城 市 
等 领域 。60 余年 来 ， 学 者 尝试 建立 各 种 区 划 问 题 数学 模型 ， 设 计 了 一 系列 的 求解 算法 ， 
包括 精确 算法 、 基 于 聚 类 的 算法 、 启 发 式 算法 和 基于 树 图 的 算法 。 针 对 现 有 算法 计算 效 
率 与 求解 质量 难以 兼顾 这 一 局 限 ， 本 文 提 出 了 一 个 基于 迭代 局 部 搜索 ILS) 的 区 划 问 题 算 
法 。 访 算法 主要 机 制 包括 : 通过 邻 域 单 元 移动 改进 分 区 质量 ; 参照 中 心 单元 快速 计算 分 
区 方差 提升 算法 速度 使 用 扰动 机 制 跳出 局 部 最 优 状态 ， 更 新 分 区 中 心 点 提升 分 区 方案 
目标 值 ， 以 及 使 用 群 搜 索 探索 更 大 的 解 空间 ; 算法 各 步骤 中 通过 分 区 修复 保持 分 区 空间 
连续 。55 个 基准 案例 测试 表明 : ILS 算法 求解 质量 优 于 ARISEL 算法 和 SKATER 算法 ， 计 
算 时 间 大 幅 低 于 ARISEL 算法 。 一 个 多 指标 气候 分 区 实验 也 验证 了 ILS 算法 的 实用 性 。 本 
X ILS 算法 兼顾 分 区 质量 和 计算 效率 ， 并 人 允许 一 个 分 区 包含 多 个 空间 连续 且 面 积 较 大 的 区 
域 ， 具 有 灵活 性 和 实用 性 。 
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区 划 是 地 理学 中 的 一 个 基本 问题 。 区 划 是 从 区 域 角度 观察 和 研究 地 域 综 合体 , 探讨 区 
域 单 元 的 形成 发 展 、 分 异 组 合 、 划 分 合并 和 相互 联系 , 是 对 过 程 和 类 型 综合 研究 的 概括 和 
尽 结 ( 郑 度 等 ，2005)[1]。 上 百年 来 ， 区 划 理 论 、 方 法 与 应 用 研究 取得 了 显著 的 进展 ， 广 泛 
应 用 于 地 理 、 坏 境 、 和 生态、 经 济 、 农 业 、 城 市 、 地 图 制图 、 空 间 统 计 等 领域 。 随 看 我 国 社 
会 经 济 的 快速 及 展 ， 为 满足 国家 和 地 区 各 行业 的 战略 决策 、 规 划 、 管 理 和 政策 制定 ， 区 划 
仍 是 一 个 基础 性 的 研究 领域 。 

纵 观 上 世纪 60 年 代 以 来 国内 外 区 划 研 究 进展 ， 区 划 研 究 有 两 大 重点 和 难点 : 区 划 的 理 
论 基础 和 分 区 边界 的 确定 。 前 者 基于 地 理 现象 的 空间 格局 、 结 构 、 过 程 、 机 理 和 噶 质 性 规 
E, EDM ART, HERR A A, Spek Rain. aT EATEN, Ze 
在 理论 研究 的 基础 上 ， 运 用 地 图 制图 、 空 间 分 析 、 空 间 聚 类 、 空 则 优化 等 手段 ， 科 学 合理 
地 划 定 分 区 按 弄 。 刘 燕 华 等 (2005) 对 于 编制 中 国 综合 区 划 方 和 荣 所 要 解雇 的 重要 科学 技术 问 
题 进行 了 深入 分 析 [2]。 郑 度 每 (2008) 深 入 阐述 了 上 自然 地 理 区 划 的 内 涵 , 提出 了 自然 地 理 区 划 
泡 式 及 关键 科学 问题 [3]， 相 关 思 想 、 理 论 和 方法 对 于 目 然 地 理 和 其 他 领域 区 划 问 题 具有 指 
导 和 借鉴 价值 。 

区 划 问 题 (regionalization problem) 是 将 特定 地 理 区 域 划 分 为 奇 干 空 间 连 续 的 分 区 ， 满 足 
分 区 内 差异 最 小 化 和 分 区 间 差 异 最 大 化 这 一 基本 原则 ， 本 质 上 是 一 个 增加 了 分 区 衬 间 连续 
约束 的 聚 类 问题 。 聚 类 问题 本 刁 的 计算 复杂 上 度 极 高 ， 分 区 空间 连续 约束 使 得 区 划 问 题 求解 
更 为 困难 。 上 自 上 世纪 60 年 代 开 始 ， 学 者 尝试 建 并 各 种 数学 模型 ， 并 设计 了 一 系列 算法 ， 包 
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括 精 确 算法 、 基 于 聚 类 的 算法 、 元 月 发 式 算 法 、 树 图 分 割 算 法 和 混 
2007)[4]。 然 而 ， 这 些 算法 存在 以 下 局 限 : 精确 算法 计算 复杂 上 度 过 
处 理 分 区 空间 连续 性 ; 树 图 分 割 算法 仅 依 据 相 邻 单 元 生成 树 图 ， 分 割 后 难以 保证 区 划 质 量 ; 
元 启发 式 算法 求解 质量 较 好 ， 但 计算 时 间 过 长 。 针 对 现 有 区 划 问 题 算 法 这 些 局 了 上限， 本文 提 
出 一 个 新 的 区 划算 法 ， 既 要 满足 区 划 质 量 ， 又 能 够 降低 算法 复杂 度 。 


2 文献 回顾 

区 划 问 题 也 称 为 空间 分 类 问题 (spatial classification problem)、 空 间 聚 类 问题 (spatial 
clustering problem)、 空 间 聚 合 问 题 (spatial aggregation problem). © JA] 47 [IX jE) i (spatial 
districting problem)、 分 区 设计 问题 (zone design problem) 等 。 尽 管 这 些 术 语 有 差别 ， 但 内 涵 
基本 一 致 ， 均 致力 于 将 地 理 空 间 划分 为 各 二 区域 ， 在 满足 特定 约束 条 件 的 前 提 下 确定 最 优 
的 分 区 方案 。 

区 划 问 题 数学 建 模 和 模型 求解 的 复杂 性 主要 体现 在 分 区 空间 连续 这 一 约束 条 件 。 针 对 
各 种 区 划 需 求 ， 不 少 学 者 详细 定义 了 区 划 雇 策 变量 、 约 束 条 件 和 目标 函数 ， 提 出 了 多 个 区 
划 问 题 数学 模型 (Cliff et al., 1975; Keane, 1975; Wright et al., 1983; Cova and Church, 2000; 
Williams, 2002; Shirabe, 2005; Duque et al., 2011; Li et al., 2014)[5]. Keane(1975) [6] 证 明了 衬 
间 连 续 性 约束 区 划 问 题 是 一 类 NP-Hard 问题 。 因 此 ， 区 划 问 题 模型 求解 的 计算 复杂 度 极 高 。 
P-regions 问题 将 n 个 空间 单元 划分 为 p 个 连续 区 域 ， 是 一 个 经 典 的 区 划 问 题 。 该 问题 可 表 
达 为 三 种 混合 整 型 规划 (MIP) 模 型 : 树 模 型 、 次 序 模型 和 网 络 流 模 型 (Duque et al., 2011)[11]. 
然而 ， 基 于 数学 模型 的 精确 算法 仅 能 够 求解 空间 单元 数量 很 少 的 小 规模 问题 。 例 如 ， 
CPLEX 模型 计算 表明 : 针对 n=49 和 p=3~10 的 基准 有 宁 例 ，3 小 时 的 计算 时 间 均 不 能 获得 最 
优 解 [11]。 

基于 肾 类 分 析 的 区 划 方 法 包括 : 基于 经 典 聚 类 分 析 的 方法 、 距 离 加 权 聚 类 分 析 方 法 、 
M-means 聚 类 方法 和 凝聚 层次 聚 类 方法 。 前 三 种 方法 ， 思 路 简单， 但 处 理 空 间 连 续 性 分 区 
的 能 力 不 足 ， 以 牺牲 分 区 质量 为 代价 保证 分 区 空间 连续 。 经 典 的 层次 聚 类 方法 较为 成 功 地 
应 用 于 区 划 ， 拭 法 流程 如 下 : (首先 将 每 一 个 空间 单元 作为 一 个 分 区 : (2) 计 算 各 分 区 见 
的 相似 度 ; (3) 寻 找 近 似 度 最 接近 且 连 续 的 两 个 分 区 ， 把 他 们 合并 为 一 个 分 区 ; (4) 重 复 步 
又 (2) 和 (3)， 直 到 分 区 数量 满足 区 划 目 标 。 步 又 (2) 中 分 区 相似 度 的 计算 有 多 种 方法 ， 如 方 
兰 最 小 (Ward)、 两 个 分 区 中 最 接近 单元 的 相似 度 (single linkage)、 两 个 分 区 中 两 个 兰 卉 最 大 
单元 的 相似 度 (complete linkage)、 两 个 分 区 中 单元 均值 或 中 值 的 相似 度 (average linkage) 等 。 
步 又 (3) 限 制 相 邻 区 域 合 并 ， 保 证 分 区 的 连续 性 。 该 方法 采用 目下 而 上 的 分 区 合并 策略 ， 适 
合 于 分 区 数量 不 确定 的 区 划 问 题 ， 但 步骤 C2) 相 似 度 计算 方法 和 步骤 (3) 空 间 邻 接 约束 对 于 
聚 类 树 的 形成 影响 很 大 (Guo, 2008)[13]。 

局 友 式 区 划算 法 的 基本 原理 是 : 先 构造 一 个 可 行 的 区 划 方 案 ， 再 使 用 邻 域 算 子 进行 迭 
代 搜 索 改 进 。 第 一 步 使 用 区 域 种 子 生 长 、 聚 闫 分析 或 其 他 简单 算法 构造 一 个 可 行 的 区 划 解 ， 
第 二 步 根据 当前 的 分 区 方案 和 空间 单元 间 的 空间 关系 ， 演 试 进行 空间 单元 的 移动 达 代 地 改 
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进 区 划 方 案 。AZP 方法 是 Openshaw (1977)[14] 提 出 的 一 个 经 典 区 划算 法 ， 先 将 n 个 空间 单 
元 随机 划分 为 个 区 域 ， 在 顾及 分 区 空间 连续 约束 的 前 提 下 ， 尝 试 将 某 个 单元 重新 分 配 到 
男 一 个 区 域 ， 持 续 改 进 区 划 方 案 。 本 质 上 ， 该 算法 属于 扑 山 算法 ， 搜 索 过 程 容易 陷入 局 部 
最 优 而 过 早 停滞 。 

为 避免 邻 域 搜索 过 程 陷 入 局 部 最 优 ， 学 者 不 断 改 进 算法 ， 通 过 模拟 退火 (Browdy, 1990; 
Openshaw and Rao, 1995)[15][16]. #2 Œ (Openshaw and Rao, 1995)[16] 等 元 局 发 机 制 ， 提 升 搜 
索 过 程 的 多 样 性 ， 从 而 获得 较 高 质量 的 区 划 方 案 。Duque and Church(2004) 改 进 禁 忌 算法 为 
ARISEL 算 法 [17]。 该 算法 使 用 简单 方法 提供 多 个 初始 区 划 方 案 ， 选 择 高 质量 区 划 方 案 进 行 

为 降低 邻 域 搜索 的 计算 复杂 度 ， 学 者 提出 了 基于 树 图 的 司 发 式 算 法 : 先 将 区 域 抽象 为 
网 络 图 ， 再 将 网 络 图 简化 为 树 图 ， 通 过 树 分 割 获得 空间 连续 的 区 域 。 树 结 扣 代表 空间 单元 ， 
树干 表示 空间 单元 间 的 邻接 关系 ( 郭 仁 忠 ,1985)[18]。Maravalle and Simeone(1995) [19] 提 出 
了 一 个 基于 树 图 的 区 划 问 题 算法 (MIDAS): 根据 图 G 生 成 树 7, MBE THY p-1 条 连接 获得 p 
棵 子 树 ， 代 表 p 个 空间 连续 的 区 域 。 因 树 7 上 的 解 空间 很 有 限 ，MIDAS 算法 尝试 不 断 调整 
M TA 7# 获 得 更 好 的 分 区 方案 。 此 后 ，Assuncio et al. (2006) 基 于 最 小 生成 树 概 念 提出 了 一 
个 区 划 问 题 算法 SKATER[20]。Guo(2008) 改 进 该 算法 为 RADCAP 算法 ， 提 出 了 6 种 动态 
树 生 成 方法 [13]: First-Order-SLK、First-Order-CLK、First-Order-ALK、Full-Order-SLK、 
Full-Order-CLK 和 Full-Order-ALK. KWAI: Full-Order-CLK 和 Full-Order-ALK 优 于 其 
他 生成 树 方 法 。 

总 体 上 ， 聚 类 算法 思路 简单 且 容 易 实 现 ， 但 这 类 方法 有 的 难以 保证 分 区 连续 性 ， 有 的 
虽 顾 及 分 区 连续 性 但 不 能 保证 全 局 优化 质量 。 局 发 式 算法 类 型 众多 ， 启 发 改进 方法 设计 思 
路 简单 ， 但 优化 性 能 有 限 : 元 局 发 方法 性 能 较 蜗 ， 但 这 一 类 算法 设计 较为 复 淋 ， 计 算 效 率 
偏 低 。 基 于 生成 树 的 方法 ， 计 算 效 率 大 幅 提 升 ， 但 同时 大 幅 降 低 了 搜索 空间 ， 影 啊 到 区 划 
质量 。Aydin et al. (2021)[21] 设 计 了 基准 测试 案例 ， 测 试 了 AZP、AZP-SA、AZP-Tabu、 
ARISEL、SKATER 和 REDCAP 算法 。 计 算 结果 表明 : ARISEL 算法 总 体质 量 最 高 ， 但 计 
TRIR; SKATER 算法 求解 质量 尚好 ， 计 算 效率 非 第 高。 考虑 到 区 划 问 题 应 用 领域 越 
来 越 三 ， 在 应 用 中 对 于 区 域 规划 、 决 策 影 响 较 大 ， 有 必要 设计 更 有 效 地 的 区 划算 法 ， 既 你 
证 区 划 质 量 ， 叉 能 够 快速 计算 。 


3 区 划 问 题 定义 
某 一 地 理 区 域 共有 个 空间 单元 ， 记 为 集合 U={1, 2, 3 ... mY。 每 个 单元 有 m 个 属性 ， 
记 为 集合 4={1, 2,3... m}， 单 元 i 属性 为 ay, an as.. am。 将 地 理 区 域 划 分 为 p 个 空间 连 
续 的 分 区 ， 记 为 集合 C={1, 2, 3 ..…. p}， 分 区 i 包含 的 地 理 单元 解 为 6c， 满 足 ci NG =o 六 
[Al cy U cz U Cg U .cs = U， 即 任意 两 个 分 区 无 重 释 ， 每 个 空间 单元 必须 划分 在 特定 分 区 
中 。 分 区 目标 是 分 区 内 单元 属性 方差 之 和 最 小 : 
Cop he hee sen (errs (1) 
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式 (1) 中 Qix 为 分 区 i 中 所 有 时 元 属性 的 平均 值 。 

在 区 划 实 践 中 ， 有 几 个 实际 问题 需要 考 碟 。 首 先 ， 考 虑 到 不 同属 性 的 舍 义 和 量 纲 存在 
到 寞 ， 通 第 采用 标准 化 后 的 单元 属性 值 。 和 常用 的 数据 标准 化 方法 包括 : 标准 兰 标 准 化 方法 、 
最 大 最 小 极 值 标准 化 方法 、 线 性 比例 标准 化 方法 等 。 其 次 ， 考 虑 属性 的 重要 性 可 能 不同 ， 
可 为 每 个 属性 设置 权重 。 令 单元 标准 化 属性 信 为 by, bi, bis … bin 为 标准 化 属性 值 ， 属 性 
的 权重 为 wk， 区 划 目 标 函 数 为 ; 


Rey Tee Te Dee Wl be Ba) (2) 
一 般 地 ， 可 统计 每 个 属性 的 R2 指 标 评价 分 区 质量 ; 
RK = 1— Yiec di ER: Wk (bjx = bi) / È jeu Wk (Dix 一 By) (3) 


其 中 及 为 属性 k 的 平均 值 。 如 采用 标准 差 标 准 化 方法 ， 则 均值 bj. = 0。 同 时 ， 可 计算 总 体 
R“ 指 标 评价 分 区 质量 : 


R? = 1 — iec X jec; brea We (bjk — Bi) / X jeu Urea We (dix — Bx) (4) 
4 算法 设计 


求解 区 划 问 题 存在 多 个 难点 。 弟 先 ， 本 文 将 区 划 问 题 定义 为 一 个 增加 了 空间 连续 约束 
的 聚 类 问题 ， 满 足 空 间 连 续 条 件 使 区 划 问 题 求解 变 得 较为 复杂 。 区 划算 法 中 ， 分 区 空间 连 
续 判 断 与 空间 连续 修复 是 求解 算法 中 两 个 较为 频 苔 的 操作 。 其 次 ,目标 函数 (2) 中 分 区 i 的 
均值 bi 计算 较为 复杂 ， 容 易 造 成 算法 计算 效率 偏 低 。 为 加 快 计算 ， 可 采用 分 区 中 心 点 的 属 
性 值 取代 均 值 bj.。 在 区 划 方 案 中 ， 确 定 每 个 分 区 的 中 心 点 ， 有 利于 快速 评估 区 划 方 案 目 标 
值 。 基 于 以 上 分 析 ， 本 文采 用 基于 中 心 的 区 划算 法 ， 并 保持 每 个 分 区 空间 连续 。 
选择 迭代 局 部 搜索 (ILS) 算 法 作为 求解 区 划 问 题 的 算法 框 保 。ILS 算法 思路 简单 、 易 于 
实现 ， 对 于 离散 优化 问题 行 之 有 效 (Lourenco et al., 2010)[22]。 该 算法 从 一 个 初始 解 开始 ， 
迭 代 地 进行 扰动 和 局 部 搜索 。 局 部 搜索 容易 陷入 局 部 最 优 ， 对 当前 位 置 的 扰动 能 够 使 算法 
脱离 局 部 最 优 。 初 始 解 生成 、 局 部 搜索 和 扰动 使 ILS 算法 的 基本 模块 。 为 提升 ILS 算法 优 
化 性 能 ， 本 文 改 造 单 解 ILS 算法 为 群 解 ILS 算法 。 改 进 ILS 算法 流程 如 下 : 
参数 : 群 大 小 (psize)， 破 环 强 度 (streneth)， 连 续 未 更 新 最 好 解 循 环 数 (mloops)。 
1. Pop = GeneratelnitialSolutions(psize); 
2. spes=Best(Pop); 
3. notImpr=0; 
4. While notImpr < mloops: 


5. Select a solution s from P randomly; 
6. s'=Perturbation (s, strength); 
7 
8 


s"=LocalSearch(s’); 
. § =updateCenetrs(s”) 
9. IERSK Svest: Sbes™s, notImpr=0; 
10. else: notImpr+=1; 
11. P=UpdatePopulation (P, s*); 
12. Output s. 


步骤 (1) 算 法 采用 经 典 K-medoids 算法 产生 初始 解 。 访 算法 随机 选择 p 个 空间 单元 作为 
分 区 中 心 ， 和 迭代 进行 单元 指派 和 中 心 点 更 新 ， 直 到 所 有 中 心 点 不 能 更 新 为 止 。 指 派 是 将 每 
个 空间 单元 指派 到 最 近 的 中 心音 元， 计算 简单 ;， 受 研究 区 形状 和 地 理 要 系 空 间 分 布 的 影响 ， 
站 派 形 成 的 分 区 不 能 满 保 证 其 空间 连续 ， 为 此 算法 需要 判断 分 区 的 空间 连续 性 ， 并 进行 连 
续 性 修复 。 

步骤 (7) 采 用 分 区 边界 单元 移动 方法 进行 局 部 搜索 。 该 方法 答 试 移动 某 一 个 边界 单元 到 
相 邻 的 分 区 ， 寿 该 移动 能 够 减少 区 划 目 标 ， 则 更 新 当前 解 。 这 一 操作 需要 考虑 分 区 的 空间 
连续 性 ， 保 证 单元 移动 后 分 区 连续 性 约束 仍然 得 到 满足 。 

步骤 (6) 进 行 分 区 方案 扰动 。 常 用 的 扰动 方法 很 多 ， 例 如 ， 破 环 若干 分 区 、 破 环 一 个 连 
续 区 域 、 破 环 一 定 比 例 的 边界 单元 ， 然 后 进行 解 的 修复 。 大 修复 后 ， 分 区 不 能 保证 空间 连 
续 ， 则 继续 进行 空间 连续 修复 。 

与 基于 单 解 的 搜索 算法 相 比 ， 改 进 ILS 算法 维护 一 组 解 。 首 先 ， 算 法 步 又 (1) 生 成 一 组 
初始 解 ， 其 次 ， 每 一 次 迭代 开始 ， 从 群 解 中 随机 选择 一 个 解 作为 当前 解 进行 搜索 ( 步 台 5); 
第 三 ， 搜 索 完 成 后 ， 使 用 新 解 更 新 群 解 (步骤 11)。 群 解 更 新 中 ， 优 先 考 虑 解 的 目标 值 ， 其 
次 考虑 解 的 差异 程度 ， 保 持 群 解 之 间 有 一 定 的 差异 。 基 于 群 解 的 ILS 算法 维护 一 组 具有 差 
异 度 的 精 贡 解 ， 扩 大 了 解 空 间 搜索 范围 ， 有 利于 改进 求解 质量 ， 同 时 ， 算 法 收敛 速度 通常 
会 变 慢 ， 计 算 时 间 有 一 定 的 增加 。 

因 本 文 算法 基于 中 心 单 元 评估 分 区 目标 ， 局 部 搜索 完成 后 ， 步 又 (8) 答 试 更 新 中 心 单元 ， 
使 分 区 目标 值 进一步 降低 。 

空间 连续 性 判断 是 区 划算 法 中 的 一 个 关键 步骤 。 本 文 使 用 生成 树 判 断 分 区 的 连续 性 
(Xiao 2008; Liu et al. 2016)[23][24]。 大 一 个 分 区 中 的 所 有 单元 能 构成 一 个 生成 树 ， 则 广 分 
区 连续 。 考 虑 到 一 些 特殊 情形 ， 本 文 允许 一 个 分 区 包含 两 个 或 多 个 面积 较 大 的 区 域 。 图 1 
左 图 中 ， 瘤 色 、 标 色 和 绿色 分 区 均 包 括 两 个 部 分 。 所 有 蓝 色 或 标 色 部 分 的 面积 均 较 大 ， 可 
认为 赣 色 区 域 和 标 色 区 域 是 空间 连续 的 分 区 。 而 绿色 部 分 中 ， 因 其 中 一 块 过 小 ， 将 其 视 为 
空间 不 连续 的 破碎 单元 。 本 文 空 间 连 续 判 断 方 法 如 下 : () 针 对 有 茶 一 分 区 ， 从 任意 单元 开始 
构造 生成 树 ; (2) 大 有 茶 些 单元 不 能 连接 到 生成 树 上 ， 则 针对 剩余 单元 构造 新 的 生成 树 ; (3) 
重复 步骤 (2) 直 到 没有 剩余 单元 ; (和 计算 每 一 个 生成 树 对 应 单元 数 和 面积 ， 奋 有 茶 一 生成 
树 单元 数 或 面积 小 于 规定 的 靖 值 ， 则 认为 该 区 域 不 连续 ， 同 时 ， 单 元 数 或 面积 过 小 生成 树 
对 应 的 单元 是 破 科 单 元 。 针 对 空间 不 连续 分 区 ， 需 要 对 破 雁 的 单元 进行 修复 ， 将 其 指派 到 
最 近 的 相 邻 分 区 中 。 左 网 中 的 绿色 部 分 ， 有 一 块 很 小 的 斑 块 ， 共 有 5 个 单元 ， 可 将 其 作为 
破碎 单元 ， 可 将 其 指派 到 邻近 蓝 色 分 区 ， 修 复 后 的 分 区 如 右 图 。 


Fig. 1 Illustration of the spatially contiguous regions 


图 1 分 区 空间 连续 性 判断 示意 图 


5 算法 测试 
5.1 EME MIA 

算法 测试 使 用 文献 (Aydin et al., 2021)[21] 提 供 的 基准 测试 案例 集 。 该 案例 集 基 于 3 个 规 
则 格 网 地 图 数据 生成 ， 网 格 数量 分 别 为 120(10x12)、300(15x20) 和 1200(30x40)。 将 这 些 
地 图 事先 划分 为 磊 干 分 区 ， 并 根据 分 区 模拟 每 一 个 单元 的 属性 数值 。 使 用 最 终 的 模拟 数据 
进行 区 划 ， 测 试 算法 的 性 能 。 基 于 每 幅 地 图 生成 18 个 案例 ， 即 2 类 分 区 形状 、3 个 分 区 数 
量 和 3 个 数值 模拟 参数 的 组 合 。 分 区 形状 为 徐 单 矩形 为 主 (A) 和 较 复 杂 图 形 (B)， 分 区 数量 
为 5、10 和 15， 相 邻 分 区 属性 均值 差异 参数 设置 为 2>、3 和 和 4。 为 外 ， 针 对 一 幅 900(30x30) 
网 格 地 图 ， 模 拟 了 形状 不 规则 分 区 案例 ， 共 5 个 分 区 ， 数 值 模拟 参数 为 3。 综 上 ， 共 生成 
55 个 分 区 案例 ， 每 个 案例 的 单元 属性 值 分 别 随 机 模拟 100 次 。 模 拟 方法 是 : 为 每 个 分 区 设 
置 一 个 属性 均值 ， 使 用 参数 2、3 或 4 设置 相 邻 分 区 属性 均值 ， 以 方 兰 为 1 的 正 态 分 布 随机 
模拟 单元 属性 值 。 模 拟 案例 基本 情况 见 表 1， 案 例 详细 介绍 见 文献 Aydin et al.(2021) [21], 
数据 下 载 地 址 为 https://doi.org/10.6084/m9.figshare.14067239。 该 地 址 还 提供 了 6 种 算法 计 
算 结 末 、 质 量 评价 指标 和 计算 时 间 。 

表 1 基准 测试 案例 特征 
Tab.1 Characteristics of The benchmark instances 
A,B 


为 直观 地 理解 案例 ， 图 2 展示 了 4 种 区 划 方 案 : G120-5A、G300-10B、G1200-15A 和 


Blob。 方 案 名 称 由 地 图 名 称 、 分 区 数量 和 分 区 形状 组 成 。 图 3 为 这 四 个 区 划 方 案 分 列 使 用 
模拟 参数 4、2、3 和 3 生成 的 模拟 数值 ， 色 彩 深浅 代表 数值 的 大 小 。 模 拟 参 数 越 大 ， 不 同 
TY TCH BU Ze IK, ETE Sy XSI BO A; RZ, BOEI SEG BC HY EX 
域 。 
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Fig. 2 Illustration of spatial units and regions (G120 5A, G300_10B, 1200 _15A and BLOB) 
图 2 分 区 示意 图 (G120 5A, G300_10B. 1200 15A 和 BLOB) 
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Fig. 3 Simulated values of spatial units (G120 SA4, G300_10B2, 1200 1SA3 and Blob3) 
图 3 单元 属性 数值 模拟 示意 图 (G120 544, G300_10B2. 1200 15A3 和 Blob3) 
针对 每 个 分 区 方案 的 100 个 数值 模拟 ， 使 用 本 文 ILS 算法 进行 计算 ， 获 得 100 个 区 划 
方案 ， 并 计算 每 个 区 划 方 案 的 ARI 指 标 和 了 指标。ARI 指 标 表示 分 区 方案 与 真实 分 区 的 相 
似 程度 ， 越 接近 于 1 越 好 ;R“ 指标 度量 分 区 内 单元 属性 方差 的 相对 大 小 ， 越 接近 于 1 越 好 。 
表 2 列 出 每 个 分 区 方案 100 个 分 区 结果 ARI 指 标 和 了 -指标 的 平均 值 ， 并 与 Skater 和 ARISEL 
算法 进行 比较 ， 其 中 ，ARISEL 和 Skater 算法 区 划 指 标 来 自 文献 [21] (Aydin et al., 2021)。 可 
以 看 出 : 总 体 上 ILS 算法 结果 优 于 ARISEL 算法 ， 而 ARISEL 算法 优 于 Skater 算法 。 针 对 
模拟 参数 为 2 的 高 难度 案例 ，ILS 算法 优势 更 为 显著 。 
表 2 基准 案例 ARI 指数 和 R 指数 均值 统计 
Tab. 2 ARI and R: indexes from 55 benchmark instances 
100 个 ARI 指 数 均值 100 个 R? FERGJE 
Skater 
0.665 


0.748 


0.924 | 0979 | 0971 | 0966 0.971 
0.801 
0.882 


0.926 
0.765 


G120 10A2 
G120 10A3 
G120 10A4 
G120 10B2 
G120_10B3 0.884 
G120_10B4 0.934 


G300_5A4 0.991 
G300_5B2 0.901 
G300_5B3 0.968 
G300_5B4 0.991 
G300_10A2 0.869 
G300_10A3 0.962 
G300_10A4 0.991 
G300_10B2 0.867 
G300_10B3 0.973 
G300_10B4 0.994 
G300_15A2 0.859 
G300_15A3 0.962 
G300_15A4 0.991 
G300_15B2 0.877 
G300_15B3 0.968 
G300_15B4 0.993 
G1200_SA2 0.960 
G1200_5A3 0.986 
G1200_5A4 0.995 
G1200_SB2 0.955 
G1200_5B3 0.988 
G1200_5B4 0.996 
G1200 10A2 | 0.886 
G1200 10A3 | 0.981 
G1200 10A4 | 0.995 
G1200 10B2 | 0.909 
G1200 10B3 | 0.986 
G1200 10B4 | 0.997 
G1200 15A2 | 0.874 
G1200 15A3 | 0.968 
G1200 15A4 | 0.993 
G1200 15B2 | 0.892 
G1200 15B3 | 0.978 
G1200 15B4 | 0.993 


针对 图 3 中 Blob 模拟 数值 案例 ， 本 文 ILS 算法 的 优势 更 加 明显 。 图 4 中， 左边 2 个 区 
KUT SEAN ILS 算法 结果 ， 右 边 2 个 区 划 方 案 为 ArcGIS 10.3 中 Skater 算法 结果 。 可 以 看 出 ， 
ILS 算法 较 完 美 地 还 原 了 事先 设 定 的 分 区 ， 而 Skater 算法 混淆 了 部 分 分 区 。ArcGIS 的 计算 
时 间 约 为 2.5~2.7s，ILS 算法 需 5.1~7.1s。 图 4 中 ，4 个 区 划 指 标的 值 分 别 为 0.872、0.891、 
0.567 和 0.719. 
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ILS (p=3) ILS (p=5) Skater (p=5) Skater (p=6) 


Fig. 4 Regionalization results from Blob instance 
图 4 Blob 案例 分 区 结果 

表 3 为 三 个 算法 的 计算 时 间 比 较 ， 其 中 ，ARISEL 和 Skater 算法 计算 时 间 来 自 文献 [21] 
(Aydin et al., 2021)。 可 以 看 出 : (1) 在 ArcGIS 中 实现 的 Skater 算法 计算 速度 最 快 ， 随 案例 
规模 增 大 ， 计 算 时 间 增 加 较 少 ，(2)ARISEL 算法 计算 时 间 最 长 ， 随 案例 规模 增 大 ， 计 算 时 
间 快 速 增长 ，(3) 本 文 ILS 算法 计算 时 间 高 于 Skater 算法 ， 但 远 低 于 ARISEL 算法 。 应 当 注 
意 ，3 个 算法 的 计算 环境 差异 很 大 ， 不 能 直接 比较 计算 时 间 ， 但 计算 时 间 能 够 大 体 上 反映 
各 个 算法 的 计算 效率 。 


表 3 计算 时 间 比 较 


Tab. 3 Comparison of the computation times 


Coso osa | 42.76 | 035 | 1.72 | G300058 | 4830 | 060 | 1.60 


300-154 [2830 | 059 | 132 | G30015B | 2628 | 0.60 |155 


5.2 黄 淮 海地 区 气候 分 区 

为 进一步 测试 本 文 算法 ， 选 择 黄 淮 海地 区 尝试 进行 气 修 区划。 前 先 ， 本 文 黄 淮 海地 区 
包括 黄河 、 淮 河 、 海 河流 域 及 山东 半岛 ， 其 次 ， 使 用 该 区 域 15 分 网 格 30 年 年 均 降 雨量 和 
年 均 温 肛 进 行 分 区 。 该 案例 区 包括 2478 个 空间 单元 ， 空 间 范 围 如 图 $ 押 示 。 研 究 区 每 个 单 
元 有 60 个 属性 数据 ， 即 30 个 年 均 降 雨量 数据 和 30 个 年 均 气 温 数据 。 


Fig. 5 Map of a case study area 
图 5 研究 区 示意 图 
针对 黄 淮海 地 区 气候 数据 ， 分 别 采 用 ArcGIS 10.3 中 Skater 算法 和 本 文 ILS 进行 气候 区 

划 。 气 候 分 区 数量 分 别 设置 为 3、4、5、6、7、8、9、10、12 和 1$， 并 假定 所 有 属性 的 权 
重 相 同 ， 均 为 1。Skater 算法 和 本 文 ILS 算法 均 使 用 标准 差 标准 化 方法 将 60 个 属性 数据 进 
行 标准 化 处 理 ， 完 成 区 划 后 ， 统 计 每 一 个 属性 数据 的 R 指标 和 标准 化 数据 的 总 体 R? 指标 。 
K 4 中 提供 了 Skater 算法 和 ILS AKRA RA R 指标， 包括 60 个 属性 R 指标 的 最 小 值 
(MinR2)、 平 均值 (AvgR2) 和 最 大 值 (MaxR2)， 也 包括 标准 化 数据 的 总 体 R 指标 (R2) 和 计算 
时 间 。 可 以 看 出 ，ILS 算法 区 划 质 量 指 标 显 著 高 于 Skater 算法 ， 同 时 Skater 算法 计算 效率 
大 幅 领 先 于 ILS 算法 。 


K 4 研究 区 气候 区 划 R* 指 标 统计 
Tab 4. The R° indexes from the case study area 


Sater EES 
| 6 | 0.592 | 0.804 | 0.896 | 0.804 | 443 | 0.645 | 0.855 | 0.912 | 0.855 | 33.18 _| 
| 8 | 0.621 | 0.846 | 0924| 0.846 | 455 | 0.692 | 0.885 | 0.943 | 0.885 | 31.58 _| 
l 


9 | 0692| 0862| 0926| 0862| 462 | 0706| 0894| 0.945 | 0894| 32.10 
12 46.62 


图 6 为 分 区 数量 为 6 时 ，Skater 算法 和 ILS 算法 的 区 划 结 末 。 可 以 看 出 ， 两 者 区 划 结 采 
天 异 较 大 ， 表 现在 区 域 形 状 、 大 小 和 边界 的 兰 异 。Skater 算法 结果 中 ， 分 区 呈 块 状 ; 而 


ILS 算法 结果 中 ， 分 区 更 倾 同 于 条 市 形状 ， 符 合 该 研究 区 气温 、 降 雨量 、 地 形变 化 的 总 体 
空间 规律 。 从 了 指标 看 ，ILS 算法 分 区 指标 (0.855) 显 著 优 于 Skater 分 区 指标 (0.804)。Skater 
算法 基于 相 邻 单元 的 相似 性 ， 不 考虑 非 邻 单元 之 间 的 关系 ， 导 致 算法 具有 一 定 的 局 限 性 。 
ILS 算法 克服 了 Skater 算法 过 于 关注 局 部 的 局 限 ， 从 而 使 提升 了 区 划 质 量 。 
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Fig. 6 The map of climate regions (Top: ArcGIS, bottom: ILS) 
图 6 研究 区 气候 区 划 示 意图 (EB ArcGIS, FE ILS 算法 ) 


5 结论 

本 文 提 出 了 一 个 改进 ILS 算法 用 于 求解 区 划 问 题 。 该 算法 由 初始 解 生 成 、 局 部 搜索 、 
群 解 搜索 、 解 扰动 、 中 心 点 更 新 等 部 分 构成 ， 且 通过 分 区 空间 连续 判断 和 修复 操作 保证 当 
前 解 中 所 有 分 区 空间 连续 。 该 算法 基于 分 区 中 心 点 评价 分 区 目标 值 ， 大 幅 降 低 了 目标 函数 
的 计算 ， 从 而 提升 了 算法 效率 。 算 法 采用 群 搜索 、 解 扰动 和 中 心 点 更 新 ， 扩 大 了 解 的 搜索 
空间 ， 从 而 提升 分 区 质量 。 基 准 案 例 测 试 表明 : 改进 ILS 算法 区 划 结 果 明 显 优 于 Skater 算 
法 和 ARISEL 算法 。 对 于 无 明显 气候 分 区 边界 的 多 属性 气候 分 区 ， 改 进 ILS 算法 分 区 目标 
值 显 著 优 于 Skater 算法 ， 分 区 结果 与 区 域 地 形 、 气 温 、 降 雨 的 分 布 模式 相 吻 合 。 

本 文 改 进 ILS 算法 设计 具有 几 个 显著 的 特点 和 优势 。 第 一 ,与 AZP、AZP-SA、AZP- 
Tabu 和 ARISEL 相 比 ，ILS 算法 选择 分 区 中 心 点 进行 目标 函数 计算 ， 避 人 免 了 局 部 搜索 过 程 
频繁 地 计算 分 区 中 单元 属性 均值 ， 从 而 大 幅 地 提高 了 算法 计算 效率 。 第 二 ，AZP 算法 属于 
简单 的 启发 式 算法 ，AZP-SA、AZP-Tabu 算法 改进 了 搜索 策略 ， 属 于 元 局 发 算法 范畴 ， 有 
效 地 提升 了 算法 质量 ， ARISEL 使 用 多 个 初始 解 ， 并 选择 高 质量 解 进行 禁忌 搜索 ， 扩 大 了 
搜索 空间 。 改 进 ILS 算法 使 用 群 解 、 扰 动 、 中 心 点 更 新 等 方法 ， 区 别 有 现 有 算法 设计 ， 充 
分 利用 了 成 熟 的 优化 算法 机 制 。 第 三 ，SKATER 仅 考 虑 相 邻 单元 区 之 间 的 相似 性 ， 大 幅 降 
低 了 搜索 空间 ， 计 算 效 率 很 高 。 而 REDCAP 算 法 仅 考 虑 相 邻 分 区 之 间 的 相似 性 ， 通 过 自 下 
而 上 方式 完成 肾 类 。ILS 算法 通过 搜索 和 扰动 元 服 了 SKATER 和 REDCAP 算 法 的 过 于 短视 
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的 局 限 ， 有 利于 搜索 到 高 质量 分 区 。 综 上 ，ILS 算法 的 这 些 特 征 ， 保 证 了 分 区 质量 ， 又 有 
效 降低 了 算法 的 复杂 度 。 

考虑 到 地 理 现 象 的 空间 渐变 性 、 地 理 系统 的 复杂 性 、 空 间 分 异 规律 的 尺度 依赖 性 ， 本 
文 区 划算 法 的 使 用 应 建立 在 区 域 研究 基础 上 : 把 握 地 理 现 象 格局 与 变化 机 理 ， 理 解 特定 区 
域 的 地 理 特 征 ， 明 确 区 划 任 务 与 目标 ， 进 而 选择 合适 的 区 划 指 标 。 进 一 步 的 研究 方向 包括 : 
如 何 确定 合适 的 分 区 数量 ， 如 何 进行 数据 标准 化 处 理 ， 如 何 选择 最 适宜 差异 度 函 数 ， 以 及 
如 何 基于 本 文 算法 发 展 出 通用 的 区 划 方 法 和 软件 工具 。 
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An improved iterative local search algorithm for the regionalization problem 
Yunfeng Kong 


(Key Laboratory of Geospatial Technology for the Middle and Lower Yellow River Regions, Ministry of 
Education, Henan University, 47500) 


Abstract: Regionalization is to divide a large geographic area into a number of homogenous 


and spatially contiguous regions. It has been widely used in fields such as geography, cartography, 


ecology, environment management, socio-economy, and urban planning. Since the general 
regionalization problem has been proven to be NP-Hard, various models and solution methods for 
regionalization have be proposed since 1960s. The regionalization methods can be classified into 
four categories: exact, clustering-based, heuristic, and tree-based. However, the commonly used 
regionalization algorithms are difficult to solve the problem in an effective and efficient manner 
simultaneously. An improved iterative local search algorithm is proposed in this paper for the 


regionalization problem. There are six key mechanisms in the new algorithm: the search of moving 


boundary units to improve the current solution; the center-based approach to accelerate the 
computation of solution objective; the solution perturbation to escape from the state of local 


optimum; the frequent update of regional centers to reevaluate the solution; the population-based 
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search to explore larger solution space; and the region repair to keep spatially contiguous regions. 
The regionalization experimentations on 55 benchmark instances show that the proposed 
algorithms outperforms ARISEL algorithm and SKATER algorithm in terms of sum-squared errors 
and adjusted Rand index. A case study of the climate regionalization using 60 attributes illustrates 
that the improved ILS is effective to delineate climate regions that are compatible with the 


precipitation, temperature and landform patterns. 


Keywords: regionalization problem; iterative local search; benchmark test; case study 
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